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摘要 : 本 文 提出 了 一 个 使 用 深度 学 习 方法 预测 锂 离子 电池 分 容 工 序 的 容量 的 解决 方案 。 
该 方案 从 化 成 和 分 容 工 序 中 提取 部 分 工 步 的 物理 观测 值 记 录 作 为 特征 ,训练 了 一 个 深度 神经 
网 络 (Deep Neural Network, DNN) 实现 了 电池 容量 的 精准 预测 。 据 测试 ， 该 模型 预测 的 电 
池 容 量 与 真实 值 相 比 ， 平 均 百分比 绝对 误差 〈Mean Absolute Percentage Error, MAPE) 仅 为 
0.78%。 将 该 模型 与 生产 线 结合 ， 可 以 大 大 缩减 生产 时 间 与 能 耗 ， 降 低 电池 生产 成 本 。 
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引言 


在 锂 离 子 电池 生产 工艺 中 ， 电 池 分 容 工 序 (Grading Process ) 中 的 容量 


(CCapacity) 数据 ， 是 出 厂 前 评价 单 体 锂 离子 电池 质量 好 坏 的 一 个 重要 指标 。 厂 
家 会 将 锂 离子 电池 根据 不 同 的 容量 等 级 进行 分 档 , 相同 档 位 的 电池 会 进行 配 组 成 
为 电池 包 〈Pack)， 以 获取 更 好 的 稳定 性 和 寿命 。 

目前 常用 的 获得 锂 离子 电池 容量 数据 的 方法 是 ， 通 过 充 放 电 设 备 ， 先 对 锂 离 
子 电池 进行 完全 充电 ， 然 后 进行 多 组 阶梯 式 的 电流 放电 ， 即 让 电池 完全 放电 ， 最 
终 将 每 个 放电 工 步 的 总 容量 者 加 ， 作 为 电池 的 出 广 容量 。 

该 方法 的 缺点 是 ， 整 个 充 放 电 过 程 极 度 耗 时 耗 能 ， 以 标准 容量 为 3200mAH 
的 18650 电池 举例 ,整个 充 放电 过 程 会 持续 4~5 小 时 ， 其 中 每 个 充 放电 阶段 都 会 
消耗 非常 多 的 电能 。 

通过 技术 手段 对 生产 过 程 中 的 锂 离子 电池 的 容量 进行 预测 ， 既 可 以 满足 工程 
上 对 锂 离 子 电池 分 组 的 要 求 ， 同 时 也 能 缩减 生产 时 间 , 减少 生产 耗 能 。 传 统 的 容 
量 预测 方法 一 般 假设 电池 电压 为 线性 变化 , 结合 工 步 内 两 个 时 间 点 的 电压 差 进 行 
计算 , 估计 目标 电压 的 时 间 落 点 , 进而 估算 出 电池 的 总 放电 时 间 和 容量 (图 1)。 
这 种 方式 的 缺点 是 需要 对 锂 离 子 电 池 进 行 实际 放电 ， 同 时 预测 精度 较 差 。 
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1 线性 模型 估算 电池 容量 示意 图 

近年 来 ， 随 着 深度 学 习 技术 的 不 断 发 展 ， 一 些 深度 学 习 模型 逐渐 被 应 用 到 数 
据 预 测 的 研究 中 。 深 度 学 习 模 型 是 一 种 拥有 多 个 非 线性 映射 层级 的 神经 网 络 模型 ， 
能 够 将 输入 信息 在 多 个 隐藏 层 中 进行 抽象 ,并 提取 信息 特征 ,挖掘 出 更 深层 的 湾 
在 规律 。 在 实际 应 用 中 ， 包 括 物品 分 类 检测 问题 (object detection)、 自 然 语言 处 
理 CNatural Language Processing, NLP) 问题 、 数 学 证 明 问 题 (math improve)、 分 
子 模型 预测 问题 等 等 ， 都 得 到 了 很 好 的 表现 。 

本 文中 ， 我 们 从 单 体 锂 离子 电池 在 充电 状态 下 的 部 分 数据 中 提取 特征 ， 训 练 
了 一 个 深度 神经 网 络 预测 锂 离子 电池 的 总 放电 容量 ， 获 得 了 很 好 的 预测 效果 。 


1 深度 神经 网 络 


神经 网 络 是 基于 感知 机 的 扩展 , 而 深度 神经 网 络 (Deep Neural Network, DNN) 
可 以 理解 为 有 很 多 隐藏 层 的 神经 网 络 。DNN 有 时 也 被 称 为 多 层 感 知 机 〈Mnulti- 
Layer Perceptron, MLP ) 1, 


hidden layer 1 hidden layer 2 hidden layer 3 


input layer 


2DNN 神经 网 络 标准 模型 


按 层 的 不 同位 置 划 分 ，DNN 内 部 的 神经 网 络 层 可 以 分 为 三 类 : 输入 层 、 隐 茂 
层 和 输出 层 。 一 般 来 说 第 一 层 是 输入 层 , 最 后 一 层 是 输出 层 , 而 中 间 均 为 隐藏 层 。 
层 与 层 之 间 是 全 连接 的 ， 也 就 是 说 ， 第 i 层 的 任意 一 个 神经 元 一 定 与 第 it+1 层 的 
任意 一 个 神经 元 相连 。 虽 然 DNN 看 起 来 很 复杂 ， 但 是 从 小 的 局 部 模型 来 说 ， 还 
是 和 感知 机 一 样 ， 即 一 个 线性 关系 z = 2Zwixi + 加 上 一 个 激活 函数 o(z)。 

以 图 2 中 经 典 DNN 模型 为 例 ， 在 输入 层 输入 一 组 矩阵 序列 X = 
(Xx1, Xz2,X3… Xn)， 通 过 隐藏 层 1 获得 其 特征 1 的 特征 序列 

W = (wx WXx2, WX3*"* WXn) 
再 通过 隐藏 层 2 获得 二 次 特征 序列 
H = (wx xz hwxa *… hwxn ) 


以 此 类 推 ,， 最 后 获得 输出 矩阵 。 

在 实际 操作 中 ， 我 们 一 般 使 用 反 向 传播 机 制 来 控制 模型 的 拟 合 过 程 。 我 们 的 
神经 网 络 的 输入 层 和 输出 层 各 有 一 定量 的 神经 元 , 再 加 上 一 些 含 有 若干 神经 元 的 
隐藏 层 , 此 时 需要 找到 适合 所 有 隐藏 层 和 输出 层 对 应 的 线性 系数 和 矩阵 W 和 偏 倚 向 
量 ! 这 一 系列 参数 ， 让 所 有 的 训练 样本 经 输入 层 一 隐藏 层 一 输出 层 计 算出 的 结果 
尽 可 能 的 等 于 或 无 限 遏 近 真 实 的 测量 值 。 

为 达到 这 一 目的 ， 首 先 要 选择 一 个 适当 的 损失 函数 ， 来 度量 训练 样本 计算 出 
的 输出 和 对 应 的 真实 测量 值 之 间 的 差异 。 接 着 应 用 合适 的 优化 器 ,对 这 个 损失 函 
数 进行 优化 ; 在 求 其 最 小 化 值 的 过 程 中 ， 反 向 不 断 对 一 系列 线性 系数 矩阵 内 ， 侦 
倚 向 量 # 等 进行 更 新 ， 直 至 达到 我 们 预期 的 效果 。 


2 模型 构建 与 训练 


2.1 实验 数据 

本 文采 用 某 锂 离子 电池 厂 生产 的 18650 电池 数据 作为 实验 对 象 ， 该 批 次 电池 
参数 如 下 : 额定 电压 3.6V， 额定 电池 容量 3.2AH,， 额定 内 阻 28m 8， 最 大 充电 电 
压 4.2V， 放 电 截 止 电 压 2.5V， 充 放电 温度 26 土 5'C,， 数 据 集 为 10 万 颗 电 池 数 
据 ， 单 颗 电 池 分 容 充 放电 整体 数据 可 见 图 3。 


图 3 电池 充 放 电 整 体 数据 图 表 

实验 数据 为 约 10 万 颗 电池 数据 ， 其 中 80% 〈 约 8 万 颗 ) 数据 作为 训练 集 数 
据 (training dataset)， 在 训练 集 数 据 中 ， 我 们 另外 切割 出 20% ( 约 1.6 万 颗 ) 数 
据 作为 验证 集 数据 (validated dataset )。 

实测 数据 (test dataset) 采用 上 述 未 参与 训练 和 验证 的 约 2 万 颗 电 池 数 据 ， 数 
据 结 构 与 实验 数据 一 致 。 
2.2 特征 矩阵 

数据 以 csv 格式 进行 保存 ， 原 始 数据 含 采 样 时 间 、 循 环 、 工 步 、 工 作 状 态 、 


工作 时 间 、 电 压 、 电 流 、 容 量 、 能 量 、 温 度 、 电 池 异 常 标 记 等 11 个 数值 特征 〈 见 
表 1)。 


2021-02-28 14:18:43,0,0,3,0.0,3604.5,0,0.0,0.0,23.4,0， 
2021-02-28 14:19:24,0,0,3,0.4,3604.6,1.5,0.0,0.0,23.3,0， 
2021-02-28 14:19:27,0,0,3,0.4,3604.6,-3.5,0.0,0.0,23.2,0， 
2021-02-28 14:19:31,0,0,3,0.5,3604.5,-1.1,0.0,0.0,23.2,0， 
2021-02-28 14:19:34,0,0,3,0.5,3604.5,0.2,0.0,0.0,23.2,0， 
2021-02-28 14:19:38,0,0,3,0.6,3604.6,0.1,0.0,0.0,23.1,0, 


2021-02-28 14:19:41,0,0,3,0.7,3604.5,-0.1,0.0,0.0,23.1,0, 
2021-02-28 14:19:45,0,0,3,0.7,3604.6,-0.3,0.0,0.0,23.1.0， 
2021-02-28 14:19:48,0,0,3,0.8,3604.6,0.0,0.0,0.0,23.1,0, 
2021-02-28 14:19:52,0,0,3,0.8,3604.5,-0.1.0.0,0.0,23.1.0， 
2021-02-28 14:19:56,0,0,3,0.9,3604.5,-0.2,0.0,0.0,23.1,0, 
2021-02-28 14:19:59,0,0,3,1.0,3604.6,-0.2,0.0,0.0,23.1,1, 时 间 到 


表 1 原始 数据 示例 
我 们 认为 适合 作为 神经 网 络 的 输入 有 当前 电压 、 当 前 电流 和 当前 容量 这 些 特征 ， 
并 将 其 按照 时 间 顺 序 组 织 ， 形 成 最 后 的 输入 特征 矩阵 。 
2.3 数据 预 处 理 

原始 数据 中 存在 大 约 0.5% 左 右 的 电池 数据 ( 表 2)， 在 充 放电 过 程 中 出 现 异 
常 《 包 括 设备 异常 、 电 池 异 常 、 或 接触 异常 )， 具 体 表现 为 电池 异常 标记 列 的 值 
>10。 这 部 4 分 数据 是 无 效 的 ， 会 干扰 正常 的 模型 训练 和 预测 过 程 ， 因 此 在 提取 特 
征 的 步骤 中 我 们 已 将 出 现 这 种 情况 的 样本 剔除 。 


2020-11-04 06:14:40,0,0,3,0.0,879.4,0,0.0,0.0,29.7,0， 
2020-11-04 06:15:05,0,0,3,0.0,889.4,0.9,0.0,0.0,29.6,3020,OCV 异常 
2020-11-04 06:15:20,0,0,3,0.4,889.3,0.9,0.0,0.0,29.5,3020,OCV 异常 
2020-11-04 06:15:23,0,0,3,0.4,889.2,0.9,0.0,0.0,29.5,3020,OCYV 异常 
2020-11-04 06:15:27,0,0,3,0.5,889.1,0.9,0.0,0.0,29.5,3020,OCV 异常 


2020-11-04 06:15:30,0,0,3,0.5,888.9,0.9,0.0,0.0,29.5,3020,OCYV 异常 
2020-11-04 06:15:34,0,0,3,0.6,888.8,0.9,0.0,0.0,29.5,3020,OCV 异常 
2020-11-04 06:15:37,0,0,3,0.7,888.7,0.9,0.0,0.0,29.5,3020,OCV 异常 
2020-11-04 06:15:41,0,0,3,0.7,888.5,0.9,0.0,0.0,29.5,3020,OCV 异常 
2020-11-04 06:15:45,0,0,3,0.8,888.4,0.9,0.0,0.0,29.5,3020,OCV 异常 
2020-11-04 06:15:49,0,0,3,0.8,888.5,0.8,0.0,0.0,29.5,3020,OCV 异常 


表 2 异常 数据 示例 
在 训练 集 数据 和 测试 集 数 据 中 ,全 部 放电 工 步 的 最 终 容量 依次 累加 可 得 到 出 
厂 容量 ， 该 出 产 容量 被 作为 模型 训练 过 程 中 的 因 变 量 。 
在 进入 训练 之 前 ， 数 据 仍 经 过 了 一 系列 过 滤 : 1) 利用 scipy 模块 对 因 变 量 的 
值 求 zscore, 仅 保 留 zscore 的 绝对 值 <3 的 样本 外 ; 2) 按照 缺失 值 占 比 过 滤 特 征 ， 
如 图 4 所 示 ， 电 流 与 时 间 所 围 成 的 区 域 的 面积 总 和 (XoY 平面 内 曲线 下 面积 ) 为 
该 电池 的 出 厂 容量 。 
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电压 
| ] T4300.1 mV 
| F4200 mV 


| 3,900 mV 


上 3.600 mV 


| 3,300 mV 


T 3,000 mV 


F2700 mV 


-2,479.5 mV 
121 130 139.3 148.2 157.1 165.9 174.8 184.6 193.9 202.7 211.5 220.3 


4 出 三 容量 定义 


2.4 网 络 训 练 

本 文 使 用 Tensorflow Keras API (v2.4.1) 构 建 网 络 并 进行 训练 器 ， 网 络 由 输入 
层 、 一 个 含有 2048 个 神经 元 的 隐藏 层 和 一 个 输出 层 构 成 ， 使 用 高 斯 误差 线性 单 
元 (Gaussian Error Linear Unit, Gelu) 作为 激活 函数 内。 模型 编译 时 使 用 平均 绝对 
百分比 误差 (Mean Absolute Percentage Error MAPE ) 作为 损失 函数 , 使 用 NAdam 
作为 优化 器 中。 


epoch_loss 


5 模型 训练 过 程 
模型 训练 在 经 历 4739 个 epoch 之 后 收敛 (图 5)， 在 验证 集 上 的 MAPE 约 为 
0.8251%。 


3 预测 效果 


为 了 进一步 论证 模型 在 生产 环境 的 表现 ， 本 节 使 用 了 约 2 万 颗 电 池 的 数据 来 
做 测试 ， 验 证 数据 > 原始 数据 的 结构 保持 一 致 。 测 试 数据 采用 了 和 2.3 节 完 全 一 
致 的 预 处 理 逻 辑 , 通过 对 比 预测 值 和 实际 的 测量 值 , 可 以 计算 出 每 块 电池 的 绝对 
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百分比 误差 (Absolute Percentage Error, APE ) 。 
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图 6 电池 容量 值 分 布 
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图 7 预测 误差 在 [0, 1] 之 间 的 分 布 

6 中 红线 为 每 颗 电池 出 三 容量 的 预测 值 ， 蓝 线 为 电池 出 三 容量 的 真实 值 ， 

图 中 出 现 的 最 大 误差 为 4.6%， 最 小 误差 为 0.0032%, 平均 误差 为 0.83%。 图 7 中 


APE 在 [0, 1] 区 间 上 的 分 布 均 集 中 在 y 轴 附 近 ， 表 明 模 型 在 绝 大 多 数 样本 上 的 表 
现 更 佳 。 


4 结论 


为 解决 锂 离子 电池 出 广 容量 的 预测 问题 ， 本 文 从 充 放 电 数 据 的 部 分 工 步 中 提 
取 特 征 值 ， 建 立 DNN 模型 ， 经 过 训练 、 验 证 和 测试 ， 可 以 有 效 地 对 电池 的 最 终 
出 广 容量 进行 预测 ， 平 均 误 差 仅 为 0.83%， 拥 有 较 高 的 估算 精度 。 

在 实际 生产 中 ， 该 模型 亦 可 根据 具体 批 次 的 电池 的 理化 性 质 进 行 微调 ， 保 证 
相近 的 预测 性 能 。 因 此 该 技术 路 线 泛 化 性 极 强 ， 适 合 部 署 于 工业 生产 环境 。 将 该 
方法 与 生产 线 的 MES 系统 、SCADA 系统 或 者 是 上 位 机 系统 有 机 结合 ， 在 实际 
生产 应 用 中 可 大 幅度 缩减 生产 时 间 和 生产 能 耗 , 为 企业 提供 了 切实 可 行 的 技术 支 
持 ， 积 极 响应 了 国家 节能 减 排 的 号 召 ， 具 有 深远 的 应 用 价值 。 
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